查看原文
其他

这群视障工程师,正在用代码修“盲道”

腾讯云 2022-06-11



截至目前,腾讯云已经服务了数百万开发者。这中间,有一群特殊的开发者:视障工程师。周富贵是他们中的一员,他是一位低视力者,仅左眼有0.1的视力。


中国有将近1800万视障人士,是世界上视障人数最多的国家。视力障碍带来的影响是复杂的,限制了他们的职业选择。虽然身边大多数视障朋友从事按摩,但富贵选择了另一条道路。


今天是第十个“全球无障碍宣传日”。在数字时代,信息世界的无障碍与物理世界的无障碍一样重要。



 

只能做推拿了吗?


 

每一次打开电脑,富贵都需要把鼻尖贴到屏幕上,把屏幕内容放大5倍。用左眼仅存的一点视力看清楚细小的英文代码。

 

小时候读书,他坐在第一排。老师在黑板上写东西,别人很快就抄好了。他得站到讲台上,贴着黑板抄。有时候同学会在背后议论,用异样的眼光看待他。


“觉得挺难受的,怎么会这样呢?”

    

但大多时候,富贵觉得自己没什么不同:“他们能做的事,我也能做”。


从小学到初中,他跟大多数人一样,在普通学校里,学习数学、语文、英语。虽然费劲,但他觉得自己和他人只有“一点点区别”。

 

16岁那年,与大多数视障人士一样,富贵进入职业学校,学习康复治疗。到毕业开始找工作,他才发现,区别并不是“一点点”。投出去的简历要么石沉大海,要么就是企业以他的视力状况为由拒绝他。


大多数企业都不了解,视障人士可以做什么。中国近1800万的视障人士,大部分人都在从事推拿工作。

 

“小时候,我没有意识到视力会给我带来多大的障碍,因为我都在父母的庇佑下生活。但是踏入社会,才发现,对于一个有视力障碍的人来说,困难有很多。”

 

辗转多地,求职无果后,富贵做了两年推拿。也是因为这份工作,他认识了很多视障朋友。

 

“很多的视力障碍人士,他们从小都会被告知,你长大以后只能去做推拿,所以你现在一定要好好地把推拿学好。推拿也很好,它可以帮人解决身体上的不舒服。”

 

但是,只能做推拿了吗?这个问题一直萦绕在富贵心头。


视障工程师富贵在听屏幕上的信息


一种新的可能


 

富贵想要不同的答案。

 

他喜欢数学、享受逻辑推理,想要像所有普通人一样,尝试新的东西。看到别人弹吉他很帅,也会跟着练。


“如果不去尝试,我永远也不知道这个事我到底能不能做。”

 

一次偶然的契机,富贵接触到软件开发。通过一行行代码就能做出一个应用,这让富贵觉得新奇。一个多月的时间,除了做推拿和睡觉,他都泡在网上,看软件开发的各种视频和文本资料。

 

编程书上的代码密密麻麻,视力和英文都不好的富贵读起来很费劲。


他开始上网找视频来学习:把屏幕放大,看清后暂停画面,把代码一行行抄下来,抄完再继续播放。然后再暂停,再看,再抄写……

 

沉浸在代码的世界里,富贵找到了乐趣,也萌生了一个新的想法:做一款给视障群体使用的app,让他的朋友们也能通过手机实现各种娱乐活动。

 

视力障碍分为“全盲”和“低视力”。全盲的用户需要借助设备中的屏幕阅读器,把屏幕上的信息通过语音朗读出来。

 

即使是富贵这样的低视力人士,很多场景下也无法阅读信息。“比如在超市里,酱油和醋的瓶子很像,你必须要去看那些小字,才能分得清,但在没有工具的情况下要看清这些小字非常难。”

 

部分屏幕阅读器会为用户提供文字转语音以外的功能支持,例如OCR(光学字符识别),一项可用于图形界面识别、文字识别、坐标识别、纸质资料识别的技术。这背后是人工智能算法。



大多数普通开发者和富贵一样,都不具备开发这一技术的能力。云计算厂商正在把这些能力开发出来,以API接口的形式,让这些开发者直接调取使用,很大程度上降低了应用开发的门槛。

 

OCR提供了基础能力,但视障用户使用的是一个完整的应用,需要开发者考虑应用整体的交互体验。


比如,界面上有许多元素信息,哪些信息应该被朗读?又应该如何让屏幕阅读器按照正确的顺序朗读?这让富贵开始了对信息无障碍相关专业知识的学习与思考。


富贵分享如何利用AI帮助残障人士


经过数月的开发,富贵把视障用户常用的几类功能集合起来做成了一个工具类应用,让视障人士可以在上面听小说、查天气、逛视障者聚集的论坛。


他给应用取了个名字,叫“掌中世界”,他的很多朋友都在使用这款应用。


因为“掌中世界”,富贵在视障开发者的圈子中开始小有名气。虽然从事的还是推拿工作,但他已经能接一些软件开发需求,参与到一些项目中,积累经验和技术。

 

2020年,富贵拿到了深圳市信息无障碍研究会的offer,正式地成为了一名信息无障碍工程师。他为自己的人生争取到了新的可能性。


用技术修建“信息盲道”


 

2020年6月,信息无障碍研究会的用户体验总监吴李权给腾讯云发来一封感谢信。

 

半年前,他曾发邮件给腾讯云,为残障开发群体申请OCR能力的支持。半年过去,除了富贵开发的掌上世界,还有保益、点明、解说等多款视障群体常用的工具软件用上了这个能力,对OCR的总调用量已经超过180万次,直接覆盖超过200万视障用户群体。

 

这些数据背后,解决的是视障人士常年累月的生活场景难题。比如,网购时提取商品详情图中的文字;识别网页上的图片按钮、验证码等信息。

 

更多的视障用户使用这些软件,又挖掘出更丰富的场景:一个在北京的视障父亲,打开应用对着电视拍照后,了解了节目单的排列顺序和内容,顺利为孩子播放了小猪佩奇动画片……

 

有视障用户感慨说:“OCR和图像AI描述,就是他一双全新的眼睛。信息无障碍应用,像是科技时代的信息盲道。”


 视障人士在“看”电影


富贵还有更多期待,他希望技术的发展可以为视障群体带来更细致的描述和更丰富的感官体验:比如描述一个画面时,可以讲湛蓝色的天空,天空中流动的云,湖里泛开的涟漪…

 

富贵的朋友广荣是一个全盲的工程师。他为视障人士开发了一款“纯声音”的“吃鸡游戏”。在游戏中,每个玩家的方位上传云端,借助3D语音编解码技术,传递到耳机里的声音就是有方位感的,玩家就能判断出敌人在哪里。


即使没有画面,也能体验到游戏对战的快乐。广荣的吃鸡游戏上线后,已经获得了1000多位玩家用户。

 

今天是第十个全球无障碍宣传日。在数字时代,信息世界的无障碍与物理世界的无障碍一样重要。


随着各类互联网软件的无障碍体验逐渐完善,视障人士能够更平等地享受互联网带来的便利,也有了更多实现自我价值的选择。我们也将不断地用技术服务好开发者们,让更多的视障工程师们做出好的应用。




🔚

没看过瘾?这里还有
这条推送,事关2个亿的生意
今天超A的

也可以通过视频号了解最新动态




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存